如何抵达知识的源头

源头何处

科学理论繁复，学术界之外的无产者无法识别眼花缭乱的体系；传播逐利，本该把守真理玄关，为民众鉴别好坏的媒体，失去了声音的焦点。拍脑袋想出来的民科，经不起检验的伪科，在市场上呼声超过聪明科学家花几百万科研经费和十几年光阴做来的成果。大部分人说不出除了佛洛依德、荣格之外的心理学家的名字，而心理学界支持他们的人有多少？

大家往往批判学校守旧、科研陈腐，但高水平的学术研究，必定领先于同时代。一项科研成果，从发现到投入市场再到大众熟知，往往相隔数十年。比如计算机，先用在军队和高校，等到商业环境成熟，推广到每家每户。在畅销书领域，《转行》在2016年一出，职场和身份迷茫的人纷纷找到了指引。这本书的英文原版《Working Identity》，在2004年就已出版。书中核心理念－可能的自我，第一次正式出现在马库斯1986发表的论文《Possible selves》中。

知识生产于各大科研机构，发表在期刊上，收录在数据库中。打开它，你面对的是汪洋大海。探寻源头的你，划着独木舟，来到一条曲折水径。朝闻道，抓住定义、验证与质疑三部曲，在探源的逆流上，有什么装备帮助我们走得更远？

期刊排名、获奖科学家、文献引用率、民众普遍关心的问题、高创意与广泛使用的开源项目、跟对导师……人的兴趣、经验、机遇有别，会选择不同的装备。以下介绍新手容易掌握的文献引用率方法。

如何评价

和商品市场一样，科研的市场也有价格、畅销榜、质量认证这些让同行、消费者、评审机构更好选择和交易的体制，可借助以下指标：

ESI（Essential Science Indicators)
JCR（Journal Citation Report）
H指数 (h-factor)
SJR期刊排名
Highly Cited Researchers
谷歌学术期刊排名

怎样筛选

学术评价、行业标准建立，让我们分辨好坏，你开始在靠近源头的活水中肆意泛舟。只是你知晓了领域内大牛学者、排行榜前列的期刊，缩小了搜寻范围，剩下的文献还是千千万万。如何从如烟浩海中找出想要的？谷歌上输入人名和期刊名搜索？看见觉得对的题目，一篇文章接一篇文章下载？大牛涉猎广泛，横跨多个领域，他的文章都是你需要的？你怎么判断单篇论文好坏，核心期刊也有灌水文。手拿一篇文章单独啃，不是有效的最小行动。人脑擅长主题学习而非深度学习，一文在手不如几千篇文章一起下载。

网络科学中的二八原则，适用各个尺度：大脑中百分之二十的节点连接百分之八十的神经元、公司中百分之二十的人贡献百分之八十生产力、科学细分领域中百分之二十的学者做出百分之八十的成果…… 几十个大牛可以先看最牛的核心三到五位人物，几千篇论文可以缩小到二十多篇。找到他们，你也就慢慢接近知识的源头了。

刚入行的你，如何做到？

没有经验，可以借助知识图谱工具。这里介绍CiteSpace，简译为“引文空间”－一款基于科学计量学、数据和信息可视化的软件。软件开发者解决了以下问题：

什么时间开始研究？哪些机构在该领域研究领先？有哪些知名学者？该领域学者如何合作？研究主题的演进和热点是什么？研究前沿、基础范式和基础知识如何演变？

你在时间、空间、人物这三个维度，已经抓住了时代真实的脉络。这不是媒体报道的新发现，也不是导师告诉你的潮流。

示范：探寻知识源头

成长系的你想养成规律作息，读书运动的习惯。对抗本能和环境不容易，你想解决的问题是：如何养成一个习惯？鸡汤给你总结“六个原则”、“七个窍门”，社群分享劝导让你感到并肩战斗的安慰，几年前火热的“一万小时定律”、“21天养成习惯”似乎是离科学最近的说法。聪明的学习者不会被这些文化消费迷惑，定义－检验－质疑三部曲再次登场。你不需要亲自实验，从定义入手，你可以找到源头。

小试锋芒

拆解这个问题，你会先找出名词：习惯是什么？

你可能习惯会在搜索引擎中输入这两个字。科学的上网姿势是，用英文在wikipedia中搜。Wikipedia中条目的解释，偏向字典解释和学科知识，你可以看到该条目所在领域的上下级学科。比如habit这个词，

In the American Journal of Psychology (1903) it is defined in this way: “A habit, from the standpoint of psychology, is a more or less fixed way of thinking, willing, or feeling acquired through previous repetition of a mental experience.” Habitual behavior often goes unnoticed in persons exhibiting it, because a person does not need to engage in self-analysis when undertaking routine tasks.

你得到了心理学角度的解释，和一本权威期刊。和畅销书、时文中常见的行为层面解释不同，习惯背后是固定的心智模式和认知，通过重复体验固化。这里，定义更加清晰一些。往下看，你会注意到habit formation这个词。心理学家会不会做实验，研究你想的这个问题：实验中“习惯”的操作定义是什么？比如重复多久可以定义为习惯？

Lally et al. (2010) found the average time for participants to reach the asymptote of automaticity was 66 days with a range of 18–254 days.

Formation部分指向一篇论文，形成习惯平均需要66天。这个过程中，分解了三个步骤。这三个步骤是不是有些熟悉？有些清单文章，告诉你要创造适宜的环境来行动，给自己阶段性奖励。这两条建议夹杂在其他十几个建议，你记不住，也不知该首先做哪个。在Wikipedia这段你知道习惯形成是诱因－行动－奖励三步骤的连锁，三条建议整合成了一个行动闭环，信息组块打包成了一个。

你已经走到了知识的海滩，你发现“习惯”的内涵和外延超乎自己想象，比如人生阶段的转变带来习惯改变、习惯和目标的交互。这时候关注点容易涣散，回头看看你最初的问题，像侦探在案发现场一样，找出线索。

知识之网中，学者、论文、期刊、主题都可以成为节点，你当时直觉认定哪条线索，就顺着它走向源头。比如，你找到学者Lally这条线索，因为习惯形成平均天数wikipedia引用的是该作者论文。把作者名字丢到谷歌学术中，有时候换几个呈现方式，多搜几次。Wikipedia中提到的论文出现在文献结果第一条，但在学术作者搜索中没有找到。

在文献结果中，你可以找还有哪些论文和Habit有关，合作者是谁：找到Benjamin Gardner ，他的信息列入了学术作者中，比如h-index: 26，研究领域有：habit, behaviour change… 你得到这两个领域的关键词。

肆意汪洋

刚开始面对知识浩海，你接触的是期刊数据库。独立研究者，一般需要购买你领域的商业数据库。但目前学术成果分发，正从以前的封闭商业，逐渐转变成开放免费。开放获取期刊(Open Access) 开始流行。这种方式坚持学术期刊的同行评审原则，但是所有文章均能免费获取全文。

这里以商业数据库Web of Science为例，实践切入任意一领域源头知识。关键词是你的云帆。

WOS筛选数据

新手在找关键词上，会遇到最多坑：单个词语一词多义、隐喻用法、多学科共用，搜索结果中出现大量无关信息。如何更精确搜索，有种办法是一次用四个以上关键词。更多关键词如何组合、排除、互引，请参考WOS官方手册。

关键词确定后，简要以下几步，生成原始数据：

关键词habit以主题（topic）搜索，选择领域：neuroscience, psychology, anthropology,文本类型：article, 语种：英语，得到结果。
初步用网站分析检索结果，排除交通科学、环境政策等远距学科，留下行为心理、心理、神经和人类学等方向，剩下若干个结果。
生成引文报告：其中有被引数、施引文献、平均被引数和h指数等指标，此为原始引文报告。

此时请注意，导出引文报告包括：作者、标题、来源、摘要的信息，导出格式为纯文本。

导入CiteSpace

原始数据Cite Space，过滤、去重之后，按需求分析，生成可视图谱。

在操作界面中，需要实现不通的数据连接、比较和聚合，需求对应节点（操作）类型如下：

作者共被引：cited author,
期刊共引：cited journal，
论文共引：cited reference，
文献耦合（两篇文献共同引用一篇的情况）：paper，
文献共被引（两篇文献同时出现在另一篇文献的reference中）：cited reference；
共词分析（co-words）：keyword或者term
名词性术语共词分析：TI，DE，ID，AB，

具体操作方式，请参考CiteSpace使用手册。

扩展阅读

如何学习科学：开放科学工具箱